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(54) Verfahren und System zum Verwallen von Dokumenten 



(57) Es wird ein Verfahren lur ein System zum Er- 
schlieOen und Verwallen von in elektronlscher Form 
vorliegenden Dokumenten beschrieben. Bei dem Ver- 
fahren wifd der Quellinhatt von in einem Quelldaienlor- 
matoder inmehrerenQuelldatenlormalen vorliegenden 
Dokumenten eines erslen Typs auiomalisch analysierl 
und In ein einheKliches Zieldatenlormat konvertiert. Da- 
bei werden zumindest fOreinen Teil des Quellinhattsder 
Dokumente ersten Typs gemaR fur das Quelldatenfor- 
mat bzw. fur die Quelldalenformale kennzeichnenden 
Beschreibungsregetn autoriiaiisch Konnzeichnungen 
generiert und diesa zusammen mit zumindesi einem 
Teil des Ouellinhatts in dem Zieldalenformat als Doku- 



mente zweiten Typs abgespeichert. Zusaizlich werden 
diese Kennzeichnungen in einer Daienbank abgespei- 
chert und der in den Dokumenten zweiten Typs gsspei- 
cherte Quellinhalt uber ein Hyperiextsystem angezeigt, 
wobei zumindest ein Teil des Quellinhalts. lor den Kenn- 
zeichnungen generiert wurden, als Hyperlinks ange- 
zeigt wird, die Information zur Dereferenzierung der Hy- 
perlinks aus don in der Datenbank abgespeicherten 
Kennzeichnungen abgeleitet wird und zusatzlich uber 
logikbaeierte Anfragoolementc aulomatiech Dokumon- 
to eines dritten Typs erzeugt werden konnen, die uber 
das Hypertexlsyslem angezeigt werden und Hyperlinks 
enlhallen. die aus den in der Datenbank abgespeicher- 
ten Kennzeichnungen abgeleitet werden 
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Beschreibung 

[0001] Die vorliegande Erfindung betrilft ein Veriahren sowie ein System zum ErschlieOen und Verwalten von in 
elektronischer Form vorliegenden Dokumenten. 

[0002] Seit der EinfOhrung des Internets hat sich tOr die Verwaliung von Dokumenten in zunehmendem MaOe das 
Hypertext Transfer Protokoll (HTTP) unter Verwendung des Hypertext Markup Language (HTML)-Formats durchge- 
setzi. Dabei ertolgl eine entsprechende Dokumentenverwaltung nichi nur im Rahmen des Interneis. sondem auch in 
lokalon Anwendungen, wie beispielsweiso aul der HTML-Sprache basierenden Hiltesystemen. 
[0003] Kennzeichnend fur diese Systeme isl es, dal3 von bestffnmten, durch sogenannte Hyperlinks gekennzeich- 
neten Bereichen der Dokumente Verweise zu Stellen in anderen oder auch denselben Dokumenten exislieren, uber 
die, beispielsweise durch Anklicken mit der Maus, eine Navigation zwischen unterschiedlichen Dokumenten undAxJer 
darin bofindlichon Bezugspunkten moglich ist. 

[0004] Die Verweise sind dabei ubiichorwoiso lost als relative odor absolute Pfado in den jeweiligon Dokumenten 
angogoben. Die durch dIese Vbrweise dofinierte Struktur ist daher start und unflexibel, da bei einer Anderung der 
Positionen der einzelnen Dokumente innerhalb dos Dateisystems und/oder Verschiebung von Bezugspunkten inner- 
halb Oder zwischen Dokumenten die Venveise jeweils geandert werden mussen. 

[0005] Weiterhin ist lediglich eine einlache Punkt zu Punkt Navigation zwischen den Dokumenten moglich, eine 
wei^orgehende. komplexere Navigation, die beslimmie EigenschaHen von in den Dokumenten enlhallenen Informati- 
ons, jjeklen berOcksichtigt. ist mit diesem System nicht moglich. 

[0006] Es ist eine Aulgabe der vorliegenden Erfindung. ein Verf ahren und ein System zum Erschlie3en und Verwalten 
von in elektronischer Form vorliegenden Dokumenten anzugeben, das flexibler als die bekannten Verfahren und Sy- 
steme einselzbar ist. 

[0007] Diese Aulgabe wird durch ein Verfahren geldsl. bei dem der Quetlinhall von in einem Quelldatenformat oder 
in mehreren Quelldatenformaten vorliegenden Dokumenten eines ersten Typs automalisch analysiert und in ein ein- 
heitltchesZieldatenformal konvertiert wird, wobei zumindest fur etnen Teil des Quellinhaltsder Dokumente ersten Typs 
gemaf) fOr das Quelldatenformat bzw. fur die Quelldatenformate kennzeichnenden Beschreibungsregein automalisch 
Kennzeichnungen generied und diese zusammen mit zumindest einem Teil des Quellinhalts in dem Zieldatenformat 
als Dokumente zweiten Typs abgespeichert werden. zusdtzlich diese Kennzeichnungen in einer Datenbank abgespei- 
chert werden, und der in den Dokumenten zweiten Typs gespeicherle Quellinhalt uber ein Hypertextsyslem angezeigt 
wird, wobei zumindest ein Teil des Quellinhalts, fur don Kennzeichnungen generiert wurden, als Hyperlinks angezeigt 
wird, die Information zur Dereferenzierung der Hyperlinks aus den in der Datenbank abgespeicherten Kennzeichnun- 
gen abgeleitet wird und zusatzlich uber logikbasierte Anfrageelemente automalisch Dokumente eines dritten Typs 
erzeugt werden kdnnen, die Oberdas Hypertextsyslem angezeigt werden und Hyperlinks enthalten, die aus den in der 
Datenbank abgespeicherten Kennzeichnungen abgeleitet werden. 

[0008] Ein erfindungsgemaOes System umlaBt eine Clieni-Server-Strukluf. wobei der Server lolgende Elemente 
umfaOt: 

eine Schnittstells zum Ubemehmen von in einem Quelldatenformat oder in mehreren Quelldalenlormaien vorlie- 
genden Dokumenten eines ersten Typs von dem Client, 

eine Analyse- und Konvertiereinheit zum automalischen Analysiaren des Quellinhalts der Dokumente ersten Typs 
und zum Konvertieren des Quellinhalts in ein einheitliches Ziekiatenformat. wobei durch die Analyse- und Kon- 
vertiereinheit zumindest fOr einen Teil des Quellinhalts der Dokumente ersten Typs gemaO fur das Quelldatenfor- 
mat kennzeichnenden Beschreibungsregein automalisch Kennzeichnungen generierbar und diese zusammen mit 
zumindest einem Teil des Quellinhalts in dem Zieldatenformat als Dokumente zweiten Typs abspeicherbar sind, 
eine Datenbank und eine Extrahiereinheit zum Abspeichern dieser Kennzeichnungen in der Datenbank. 
und ein Hypertextsyslem zum Anzeigen des in den Dokumenten zweiten Typs gespeicherten Quellinhalts. wobei 
zumindest ein Teil des Quellinhalts. lur den Kennzeichnungen generiert wurden, als Hyperlinks anzeigbar sind. 
die Information zur Dereferenzierung der Hyperlinks aus den in der Datenbank abgespeicherten Kennzeichnungen 
ableitbar sind und zusatzlich uber logikbasierte Anirageelemenle automalisch Dokumente eines dritten Typs er- 
zeugbar sind, die uber das Hypertextsyslem anzeigbar sind und Hyperlinks enthalten. die aus den in der Datenbank 
abgespeicherten Kennzeichnungen ableitbar sind. 

[0009] ErfindungsgemaO werden somit in beliebigen Quelldatenformaten vorliegende Dokumente, die in ihrer Ge- 
samtheit als Dokumente eines ersten Typs bezetchnet werden, automalisch analysiert und in ein einheitliches Zielda- 
tenformat konvertiert. Dieses einheilliche Zieldatenformat enthalt dabei Kennzeichnungen fur die in den Dokumenten 
ersten Typs enthaltenen Informationen und Beziehungen, durch die diese maschinell identifiziert und als Datenobjekte 
in eine Datenbank ubernommen werden kdnnen. Diese Kennzeichnungen werden automalisch gemalJ vorgegebenen 
Beschreibungsregein erzeugt, die ebenlalls in Dokumenten abgespeichert sind und im folgenden auch als Metamodell 
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bezeichnet warden. 

[0010] Dieses Melamodell mu3 je nach gewunschlen Quelldaienformalen einmalig definiert werden. so daf) durch 

das Metamodell alle fur die jeweiltgen Ookumenle relevanten Objelile und Beziehunger^ beschroibbar sind. 

[0011] Das Metamodell basiert bevorzugt aul einer lesten ElementspeziliKalior). die im weileren auch als Mela-Me- 

£ tarTK>deli bezeichnet wird. und ist basierend aul diesem Meta-Metamodell frei definterbar. Dadurch ist gew^hrleistei, 
dal) innerhalb des Meta-Melamodells das Meiamodell in beliebiger Weise definien werden kann und eine Vielzahl von 
unterschiedlichen Dokument-, ObjeKt- und Bezlehungstypen definien und veiwaltet werden Konnen. 
[0012] Wesenllich fOr die vorliegende Eriindung ist es, dal3 durch das delinierle |y/letamodell die in den Dokumenten 
zweiten Typs generierten Kennzeichnungen aulomatisch extraf>iert werden konnen und in einer Datenbank abgespei- 

>o chert werden. Es werden somit nicht die Dokumenle selbsl und ihr struKtureller Aufbau als Daten gespeicherl, sondern 
die Mela-Daten als die in den Dokumenten beschriebenen Sachverhatte und die Beziehungen zwischen diesen Sach- 
verhallen, die typisiert gemaO dem hinlorlegten Metamodell gespeichert worden. 

[0013] Der Zugriff aul die in den Dokumenten goepetchorten informationen eriolgt dann ubor in den Dokumenten 
enlhaltene Hyperlinks, wobei die Information zur Dereferenzierung dor Hyperlinks aus don in dor Datenbank abgo- 
15 speicherlen Kennzeichnungen abgeleitot wird Die Navigation innerhalb der Dokumente erfolgt somit uber die Doku- 
mente selbst, wobei von der> Stetlen eines Dokuments, an dem Objekle bzw. Beziehungen boschrieben sind. diese 
Beziehungen als Hyperlinks unter Verwendung der in der Datenbank abgespeicherten Mela-Daten verfolgl werden 
konnen. 

[0014] Mit dem erfindungsgemaf3en Verfahren und dem erfindungsgemaOen System kann beispielsweise bei einer 
20 Mehrdeutigkeit eines uber einen Hyperlink erreichbaren Zieles eine Auswahl von mdgltchen Zielen aufgeblendol wer- 
den, aus der das gewOnschle Ziel auswahlbar ist. Dabei ist es zusatzlich moglich, dal3 uber logikbasierte Antrageele- 
mente automalisch Dokumente eines dritten Typs erzeugt werden, die uber das Hypertextsystem angezeigt werden 
und wiederum Hyperlinks enthalten, die aus den in der Datenbank abgespeicherten Kennzeichnungen abgeleitet sind. 
Durch diese k>gikbasierte Anirageelemente wird praktisch eine unbegrenzte Ftexibilitat bei der Formulierung moglicher 
2S Anfragen erreicht, die aut der Grundlage des frei konfigurierbaren Melamodells basiert. 

[001 S] Wahlweise konnen diese logikbasierten Aniragen dabei als Slandardfragen vordefiniert sein oder auch als 
individuelle Aniragen in einer vorgegebenen Aniragesprache formuliert werden, um auf diese Weise eine noch groQere 
Floxibilitat 2u erreichen. 

[0016] Bevorzugt sind in der festen Elemenlspezilikation Deklaralionen von Objekttypen, von Dokumenttypen und 
30 von Beziehungstypen detiniert. Dieses teste Meta-Mstamodell ist einerseits relativ einfach gehalten und andererseits 
trotzdem machtig genug, eine Vielzahl von Sachverhalten beschreiben zu konnen. 

[0017] Nach einer weiteren vorteilhatten Ausluhrungslorm der Erfindung wird als Zieldatenlormat das XMMExten- 
sible Markup l^nguage)-Format verwendet. Bel dem XML-Format handelt es sich um ein standardisienes Format, mil 
dem sehr llexibel Eigenschalten von Objekten und Beziehungen beschrieben werden konnen. Weiterhin ist es moglich, 
3S die in dem XML-Formal vorliegenden Zieldokumenle in das HTML (Hypertext Markup L3nguage)-Format zu konver- 
lieren, so dal) die Navigation zwischen den Dokumenten miltels eines HTML-Browsers moglich ist und die HTML- 
Ookumente uber einen Wet>-Server verwaltet werden kdnnen. Bei der Verwendung von XML-lahigen Browsern kann 
die Konvertierung nach HTML selbstverslandlich enllallen. 

[0016] Als Aniragesprache wird bevorzugt Prolog venvendel, das deterministische Antworten lielert und keine dop- 
40 pollen Ergobnissatze zurOckgibl. Weilorhin wird als Datenbank vorteilhalt eine objektorionliorto Datenbank verwendel, 
mK der Protog eng gekoppell zusammenarbeilet. so daB Obiekte und Beziehungen nicht doppelt gespeichert werden 
mussen. Bei der Formulierung von individuollen Aniragen kann dabei aul Prolog-Pradikale zuruckgegriffen werden, 
die dirokt den Begriflen des Melamodells entsprechen. 

[0019] Weitere vorteilhatte Auslohrungslormen der Eriindung sind in den Unteranspruchen angegeben. 
4S [0020] Die Erfindung wird nachlolgend anhand eines AuslOhrungsbeispiels unter Bezugnahme aul die einzige Figur 
naher beschrieben. 

[0021] In der Figur isl das erIindungsgemaOe Clienl/Seiver-Syslem 1 in vereinfachter Form in einem Blockdiagramm 
dargestellt. 

[0022] Das Clienl/Server-System 1 umlaBt eine Server-lnstanz 2, die aul einer Server-Maschine lautt und sich von 
so Clients unter einer bestimmten Netzwerkadresse ansprechen laRI. Dabei kdnnen eine Vielzahl von Server-lnstanzen 

2 gleichzeilig unter verschiedenen Netzwerkadressen unabhangig voneinander aul einem Rechner arbeilen. 

[0023] Die Server-lnstanz 2 umla(3l einen Kommandozeilen-Clienl 3, einen XML-Parser 4, eine objektorientierte 

Datenbank 5. einen enveiterten Web-Server 6 sowie ein Prolog-System 7, die untereinander Daten austauschen bzw. 

sich gegenseitig aufrufen. vine es durch eine Vielzahl von Pleilen 8 dargestellt ist. 
55 [0024] Wetterhin ist ein Web-Client 9 abgebildet. der auf einem Client-Rechner laufl und mil der Server-lnstanz 2 

ebenfalls Daten austauscht. 

[0025] Mit 1 0 bezeichnete Ursprungsdateien bilden in einem oder in mehreren unterschiedlichen Quelldatenformaten 
vorliegende Dokumenle eines ersten Typs, deren Inhall in das erfindungsgemaBe Client/Server-System 1 eingegeben 
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wifd. Beispiele liir mogliche Ookumenltypen sind Compuler-prograrrune, Personatstammblaner diner Personalverwal- 
tung. Wdnerbucher. Lexika odor dergleichen. 

[0026] FOr die Gesamiheit dieser Dokumenttypen existiert ein Melamodell 11 . durch das die in den jeweiligen Do- 
kumenttypen enlhaitenen Inlormalionen und Beziehungen beschrieben werden konnen. 
5 [0027] Zusatzlich k&inen jo Dokumenliyp sogenannie Stylesheets 1 2 vor gesehen sein. durch die ein Anzeigelayoul 
der Inhalle der Ursprungsdaleien 10 definiert wird. 

[0028] Die Ursprungsdaleien 10, das Melamodell ii und die Stylesheets 12 gelangen durch den Aulrul des Kom- 
mandozeilen-Clients 3 in die Server-lnslanz 2. Dazu wird der Kommandozeilen-CllenI 3 in den jeweiligen Clienl-Rech- 
ner geladen und ubertragt von dort die Ursprungsdaleien 10. das Melamodell 11 und die Stylesheets 12 uber das 

>o Netzwerk zum Server-Rechner. wo sie in einer Projekldokumenlenablage als Projekldaieien 1 3 abgelegt werden. 
[0029] Damitdie Inhalle der Ursprungsdaleien 10 von der Server-lnslanz 2 aulomatlsch analysiert und erlaRt werden 
konnen, mu3 (Or jedes der vorwendeten Oueltdatenformale ein goeignoler Scanner/Parser 1 4 vorgesehen soin, durch 
den gemaO dom Melamodell 11 die Ursprungsdaleien 10 in Dokumento cinos zweilen Typs mil einem einhoillichen 
Zieldalenlormat konvertiert werden konnen. Oiesos Zieldalenlormat kann boispielsweisa das sogenannie XML -Formal 

IS sein, so dad die in der Figur dargestelllen XML-Oaleien 1 5 erzeugt werden. 

[0030] Bei dieser Konvertierung werden die in den Ursprungsdaleien 1 0 enlhaitenen Inhalle sowie die Beziehungen 
zwischen diesen Inhalten von dam Scanner/Parser 14 gemaR dem Melamodell 11 und gemal) dem XML-Nulzungs- 
konzepl markiert. so da3 die abgespeicherten XML-Daleien 15 neben den ursprunglichen Inhalten der Ursprungsda- 
leien 10 Kennzeichnungen dieser Inhalle enthallen. 

20 [0031] Die aul diese Wetse in einem einheil lichen Zieldatenlormal vorliegenden XML-Daleien 15 werden durch den 
XML-Parser 4 unlersuchi, der anhand des Melamodells die automatisch erzeuglen Kennzeichnungen aus den XML- 
Daleien 15 extrahiert und in die objektorienlierte Dalenbank 5 einlragl. Es werden somit nicht die Dokumenteninhalte 
selbst und thr struklureller Aulbau in der Dalenbank gespeichert, sondern ausschlieRtich die aulomalisch generierten 
Kennzeichnungen. welche die in den Dokumenten beschrlebenen Sachverhatle und die Beziehungen zwischen diesen 

zs Sachverhallen gemaO dem hinlerlegen Melamodell beschieiben. 

[0032] Oer gesamte Import der Ursprungsdaleien 10 von seiner Ubertragung aut den Server-Rechner bis zum Ab- 
speichern in der Dalenbank S ist unteilbar und erfolgl in einer Transaktion. Hat diese Transaktion Erfolg, so werden 
di6 XML-Oaleien 15 in einer XML-Daieiabtage fur die Hypertextnavigalion freigegeben. Schlagt die Transaktion lohl. 
so werden, falls vorhanden, die alte Projektdatei wtederhergeslellt, die Datenbankanderung zuruckgenommen und 

30 weiterhin die bisherigen XML-Daleien benulzt. 

[0033] Liegen die Ursprungsdaleien 10 bereits in dem Zieldalenlormat. d.h. im Beispiel im XML-Formal oder etnem 
XML-konlormen Format (beispielsweise HTML) vor. so werden die Inhalle der Ursprungsdaleien von dem Parser 14 
transparent weiiergereicht bzw. lediglich eine Markierung der Objekie und Beziehungen durchgelOhrt. Enthallen Do- 
kumente Graphiken Oder ahnliche Elemente, so kann der Parser 14 in diesem Schriti die Ursprungsdaleien 10 in 

3S mehreie Dateten zerlegen. 

[0034] Die erzeugten XML-Daleien 1 5 werden dem enweilerten Web-Sen/er 6 zugef Ohrt. der Teil der Server-lnslanz 
2 ist. Der Web-Server 6 slelll die entsprechenden Hypertext-Navigalionsmoglichkeiten bereit. so daO die XML-Daleien 
15 uber einen Hypertext-Browser angezeigl werden konnen. Handell es sich bei dem Hypertext-Browser um einen 
HTML-Browser so wandell der Web-Sorver 6 die in XML-Formal vorliegenden Dateien beim Versenden an den Web- 

40 ClienI 9 online nach HTML um, wie es durch einen XML-»HTML-Konverter 16 angedeutel ist. Der XML-»HTML-Kon- 
veiter 16 wandell dabei nur die Kennzeichnungen in das HTML-Format um, die Objekie und Beziehungen laul des 
jeweiligen Melamodells 1 1 markieren. Dadurch wird ormogllchl, daO die Ursprungsdaleien 1 0 im HTML-Format korrekt 
angezeigl werden. Weiterhin wird bei der Umwandlung eine besondera Markierung des Zielobjekts bei der Navigation 
erzeugt. so daO dieses bei der Anzeige Ober den Web-Client 9 hervorgehoben und vom Benutzer leichter audindbar 
ist. Die Arl der Hen/orhebung wird dabei durch die Stylesheets 12 bestimml, auf die die Ookumente verweisen und 
wetehe automatisch von dem Web-Client 9 abgerulen werden. 

[0035] Der Web-Client 9 kann neben den Dokumenten auch Programmcode beispielsweise in Form von Java until 
Oder Javascript, enlhatten, der Menus und Dialoge realisierl. die zur Ausf uhrung von Suchen sowie zur Deiinition und 
AuslGhrungen von Aniragen und dergleichen dienen. 

so [0036] Neben der Navigation tnnerhalb der Dokumenle uber die aus den in der Dalenbank 5 gespeicherlen Mela- 
Oaten abgelsiteten Hyperlinks konnen logikorientierle Aniragen durch das Prolog-System 7 abgearfoeitet werden. Da- 
bei kdnnen die Anfragen in Form von Slandardanfragen vorliegen. es kann bei der Formulierung der Aniragen aber 
auch aut Prolog-Pradikate zurOckgegrilten werden. die direkt den Begriffen aus dem verwendeten Melamodell 11 ent- 
sprechen. Das Ergebnis einer solchen Anirage ist dann ein Ookument 17 mil Verweisen auf Dokumentslellen, an denen 

ss die zum Anfrageergebnis gehdrenden Objekie bzw. Beziechnungen definiert sind. 

[0037] Erste E rgebnisse kdnnen dabei Im Hypertext-Browser schon vor dem Ende der gesamten Anfragen angezeigl 
werden, da das Prolog-Syslem 7 diese salzweise Obergibt. Die Transaktionssteuerung erfolgl so, dal3 die Anfrago sich 
immer aul den Stand der Dalenbank S bezieht. wie er beim Start der An! rage vorlag. 
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[0038] Wia bereils erwahnt wurde, isl es tur das eriindungsgemaBe Verfahren und System wosentlich, daO 2um 
einen ein testes Meta-Metamodell exisitert. aul dessen Basis ein fiei kontigurierbares Metamodell zur Typisiarung der 
Dokumenteninhialte definierbar ist. Dabei wird dieses Metamodell fur die Gesamll^eit der zu verwendenden Quellda- 
tertlormate enlsprechend der in den Dokumenten gespeicherlen, inleressierer^den Objekte und Bezietiungen einmaltg 
s detinlert und der automatischen Exiraktion der Objekte und Beziehungen zugrundegelogl. 

[0039] Eine nwglictie Metamodellspezifikalion besleht beispielsweise aus den tolgenden drel Typen von Eintragen: 

t . Deklaration von Dokumenttypen 
2. Deklaratbn von Objekttypen 
>o 3. Deklaration von Beziehungstypen. 

[0040] Die Deklaration von Dokumenttypen kann oplionale Angaben von Dokumenttyp-Supertypen sowie die Inlor- 
mation enthalton. ob Dokumento diosee Typs fur dio Volllextsucho indiziert warden. Dieso Deklaration kann beispiels- 
weise in der folgenden Notation erlolgen: 
IS [0041] Dokumenttyp Dokunnenttypname 

( ist (ein I eine) Dokumenttypname )' 

( ist nicht volltextindizierbar ] 

[0042] Dabei sind Alternativen "a Oder b" dargeslellt als ( a I b ). Teile die wiedarholt warden konnen sind mit ()* 
gekennzeichnel. opttonala Teile sind mit |] geWammerl. 
20 [0043] Die Deklaration von Objekttypen enlhalt optionale Angaben der Dokumenttypen. in denen sie definiert war- 
den, sowie die oplionale Angaben von Objekttyp-Supartypen in der Form 
[0044] Objekttyp Objekttypname 
( ist (ein I eine) Objekttypname )* 
( ist definiert in Dokumenttypname )' 
zs [0045] Die Deklaration von Beziehungstypen enthalt die Angaben der Ziel-Resource. bzw. alle von diesen abgelei- 
teten Subtypen. und deren Kardinalilaten mit optionaler Angabe der Dokumenttypen. in denen sie definiert warden 
konnen und optionaler Angabe von Beziehungstyp-Supertypen. Diese kann formuliert werden als 
[0046] Bezietiungstyp Beziehungstypname ( alias Alias Name ] 
von n1 bis n2 I* Resourcetypname 
30 nach ml bis m2 I* Resourcetypname 

( ist Teilmenge von Beziefiungstypname )* 
( ist definiert in Ookumenltypname )* 
[0047] Alle vorkommenden Typen mOssen in gonau etnem Einirag deklarlert werden. Jeder Typ muB durch seinen 
Namen eindeutig gekennzeichnet seln. w«3bei Namen mil gleicfier Buchstabanraihenlolge aber unterscfiiedlicher GroR/ 
35 Kleinschreibung als gleicti gelten und fur Prolog die Aniangsbuctistaben der Namen ggf. in Kleinbucfistaben umge- 
wandelt werden. 

[0046] Zur weiteren Verdeutlichung ist im folgenden ein Ausscfinilt eines t^etamodells dargeslellt: 



Objekttyp Anwendungstyp 




ist definiert In Quellcode 


// Objekte des Typs 'Anwendungstyp' 




// werden in Dokumenten 




// des Typs 'Quellcode' definiert 


isl ein Typ 


// Vererbungsbeziehung 



4S 



Bezietiungstyp andert 




von Faliigkeit 
nacti Allribul 
kommt vor in Ouetlcode 


// Qualltyp 
//Ziellyp 

/ / Beziehungen das Typs 'andert" 
// kommen in Dokumenten 
// des Typs "Quellcode" vor 



[0049] Dieser Ausschnitt aus einar Metamodelldef inition sieht Oberfuhrt in XML folgendarmaOen aus. wobei die Teile. 
die unverandart aus der Eingabe Obemommen wurden. felt dargeslellt sind. 
[0050] <Objekt ID="Anwendungstyp" Rolle = ■Dellnition'>ObJekttyp 
[0051] Anwendungstyp 
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ist def tniert In 

<Dokument IDREF = 'Quellcodo" Rolle = •lnhalf> 
Quellcode </Dokuinent> 

Ist ein <Objekt IDREF = "Typ" Rolle = "SupBrtyp">Typ</Objekl> ■e/Objekl> 
s [0052] <Bezlehung lD='aenden* Rolle=*Definition' >Bezlehung8typ aendert 
von <ObjeW IDREF="Faehlgkeif Rolle="QuelIe->Faehlgkelt </Objekt> 
nach <Objekl IDREF='Atlribuf RolIe="Zier>Attrlbut</Ob|okl> 
komint vor In <Ookumonl IDREF= 'Quellcode' Rolle='lnhall"> 
Quellcode< / Dokuinenl> 

»o < v. 3Ziohung> 

[0053] Die aulomatisch eingeluglen Kennzeichnungen (in spitzon Klammem) dienen dazu, die im Dokument enthal- 
tenon und fur einen monschlichen Leser verslehbaro Informationon fur dio wailore Verarboilung explizit zu konnzoich- 
nen und damil maschtnell exirahierbar zu machen. ErfindungsgomaQ warden lediglich die in den spitzen Klanimarn 
angegebenen Mota-Daten in der objektorienlierten Datonbank gespeichert, wahrend der auRerhalb der spitzen Klam- 
'5 mein vorhandene, eigentliche Dokumenlinhall nur fur den menschlichen Laser gedachi ist. Die Dokumcnte werden in 
dem Daleisystem des Servers geordnet verwaltel und auf Aniorderung an den Hypertext-Browser zur Anzeige uber- 
mittelt. 

[0054] Als Aniragesprache dienen erfindungsgemaG Prolog-Ausdrucke mil der Semantik von erweilertem Datalog. 
D -^Iragen werden von dem Prolog-System 7 bearbeitcl, das eng mil der objektorientierten Dalenbank 5 gekoppelt 
20 i- . wobei die Anfragen die tolgende Form besitzen: 



Anfrage 


::= Ausdruck'.' 


Ausdruck 






'(■ Ausdruck ')' 1 




Ausdruck ( '.' 1 ';') Ausdruck 


Term 


:;= PrSdikal '(' Argument ('.' Argument)* ')' 


Argument 


::= Variable 1 Konstante 1 '_' 


Variable 


::='A' - T ( 'a' - 'z' 1 'A' • 'Z' 1 '0' - "9' )* 


Konetanle 


::= String 1 Zahl 1 Pradikat 


Siring 


::= '"Zeichon* "' 



[0055] Dabei besitzt ein Semikoton die Bedeutung oiner DIsjunklion wahrend das Komma die Bedeutung einer Kon- 
3S junktlon besitzt. 

In einem Aniragelerm Kann der Benutzer auf Pradikale zugreiten, die von dem Prok>g-System solbst, durcti selbst 
definierte Regeln. durch das Mela-Metamodell Oder durch das Metamodell def iniert sind. Pradikate sind spezielle F unk- 
'.lonen, deren Ergebnismenge nur aus den Wahrheilswerten 'wafir* und "falsch" bestetit. wobei sich als Argumente 
Konslanlen oder sogenannte Ireie Variablen einselzen lassen. Cabei ist auch die Verwendung einer univeisellen Ireien 
40 Variable als Platzhalter fur unintoressanto Dinge moglich (dargesteirt durch'J). 

[0056] Bei der Auewertung der Anfrage sucht das Prolog-System 7 alio moglichen Bologungen der Iroien Variablen 
heraus, bei denen der Anfrageausdruck insgesamt den Wahrtteitswert 'wahr' ergibl. Das Ergebnis bestehl aus einer 
Liste der moglichen Belegungen, wobei jede Belegung In einer eigenen Zeile steht. 

[0057] Handett es sich bei den Werten um durch das Metamodell definierte Resourcen (Dokumente oder Objekte) 
''S so wird der Typ- und Resourcename als Hyperlink ausgegeben. Bei Beziehungen wird jewails sowohl der Wen lur Ziel 
als auch fur Quelle als Hyperlink ausgegeben. Die Hyperlinks von einem Resourcennamen verwelsen dabei wie ubiich 
auf die Definitbnsstelle des Objekis bzw. auf das Dokument. 
[0058] Beispiele fOr Anfragen sind zur Verdeutlichung im folgenden aufgefOhrt: 

so . Welche Dokumente verwaltel die Sen/er-lnstanz? Anfrage: dokument (X). 

Welche Objekte vom Typ 'C-Funklion" gibt es? Anfrage in Prolog: object (X, "C-Funktion". _). Anfrage als vorde- 
finiertes Pradikat: c-Funklion (X, _). 

SS ~ Welche Beziehungen vom Typ "ruft" gibt es? Anfrage in Prolog: relation (X. 'ruft", _, _). Anfrage als vordefiniertes 
Pradikat: ruft (X ). 
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Bezuqszelchenllste 



[0059] 



S 1 


Client/Server-System 


2 


Server-lnsianz 


3 


Kommandozeilen-Cliem 


4 


XML-Parser 






to 6 


Web-Server 


7 


Prolog-System 


8 


Pfeilo 


9 


Web-Clier>t 


10 


Ureprungsdateien 


»s 11 


Melamodell 


12 


Stylesheet 


13 


Projektdaleien 


14 


Scanner/Parser 


15 


XML-Dateien 


20 16 


XML-*HTML-Converter 


17 


temporare Dateien 



Paten tanspruche 



Veriahren zum ErschlieBen und Verwalten von in elektronischer Fonn vorliegenden Dokumenlen, bei dem der 
Quellinhall von in einem Quelldalenforniat Oder in mehieren Quelldalentormaten vorliegenden Dokumenlen eines 
erslen Typs airtomatisch analysiert und in ein einheitliches Zieldatenlormat konvertiert wird. wobei zummdosl fur 
einen Teil des Quellinhalls dec Dokumento ersten Typs gemaO fur das Quelldatenlormat bzw. lur die Queltdaten- 
formate kennzeichnenden Beschreibungsregein automatisch Kennzeichnungen generierl und d.eso zusammen 
mil zumindest einem Teil des Quellinhalls in dem Zieldalenformat als Dokumenle zweilen Typs abgespeichert 
werden zusatzlich diese Kennzeichnungen in einer Datenbank abgespeichert werden. und der In den Dokumenlen 
zweilen Typs gespeicherte Quellinhall Ober ein Hypertextsystem angezeigt wird. wobei zumindest ein Teil des 
Quollinhalts. lOr den Kennzeichnungen generierl wurden. als Hyperlinks angezeigl wird. die lnfornr.a«.on zur De- 
reterenzierong der Hyperlinks aus den in der Datenbank abgespeicherten Kennzeichnungen abgeleitel wird und 
zusatzlich Ober logikbasierte Anfrageelemente automatisch Dokumenle eines drillen Typs erzeugl werden konnen. 
die fiber das Hypertextsystem angezeigt werden und Hyperlinks enlhalten. die aus den in dec Datenbank abge- 
speicherten Kennzeichnungen abgeleitel werden. 

2. Vertahren nach Anspruch 1 . 

dadureh gokonnzofchnot, . . . , 

dafj eine teste Elemenlspezrfikation vorgegeben ist und dal) die Beschreibungsregein basierend auf der teslen 
Elementspezifikalion frei definierbar sind. 

3. Veriahren nach Anspruch 2. 

2o"n?er^lestrn"Eteme"*sU^ Deklarationen von ObjeWtypen. von Dokumenttypen und von Beziehungs- 

typen definiert sind. 

4. Veriahren nach Anspruch 1 . 2 Oder 3. 

dadureh gekonnzoichnet, • u ^ „h 

daB die Beschreibungsregein in einem Dokument insbesondere ersten Typs abgespeichert sind. 



Veriahren nach einem der vorhergehenden Anspruche. 

dadureh gekennzelchnet, ^ . . 

daB als Zieldatenlormat das XML-(6xtensible Markup Language).Formal ven^^endet wird. 

Veriahren nach einem der vorhergehenden Anspruche. 
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dadurch gekennzeichnet, 

dalJ die in dem Zieldatenformal voiliegenden Dokumenie von einem Hypertext-Server verv/altel und in einem 
Hypertext-Browser angezeigt werden, insbesondere daB die in dem Zieldatenlorniat vorliegenden Dokumente in 
das HTML-(Hypertexl Markup LanguageJ-Formai umgewandell, die erzeuglen HTML-Dokumente von einem Web- 
5 Server verv/altet und in einem Web-Browser angezeigt werden. 

7. Verlahren nach einem der vorhergebenden AnsprOche, 
dadurch gekennzeichnet, 

tiati die logikbasierten Anfrageelemente als vorgegebene Standardanfragen definlert sind und/oder als individuelle 
>o Aniragen in einer vorgegebenen Aniragesprache lormuliert werden. 

8. Verlahren nach Anspruch 7, 
dadurch gekennzeichnet, 

dal) als Aniragesprache Prolog verwendot wird. 

IS 

9. Verf ahren nach einem der vorhergehenden AnsprOche. 
dadurch gekennzeichnet, 

daO als Oatenbank eine objektorientierte Datenbank verwendet wird. 

20 10. System zum ErschlieBen und Verwalten von in elektronischer Form vorliegenden Ookumenten (10). insbesondere 
lur ein Vertahren nach einem der vorhergehenden Anspruche, mit einer Client-Server-Slruktur, wobei der Server 
(2) umfaBI 

eine Schnittstelle (3) zum Ubemehmen von in einem Quelldatenlormat Oder in mehreren Ouelldatenformaten 

25 vorliegenden Dokumenten (10) eines erslen Typs von dem Client. 

eine Analyse- und Konvertierainheit (14) zum automatischen Analysieren des Quelllnhalts der Dokumente 
(10) ersten Typs und zum Konvertieren des Quellinhalts in ein ainheitliches Zieldalenformat, wobei durch die 
Analyse- und Konvertiereinheit (14) zumlndest tur einen Teil des Quellinhalts der Dokumenie (10) ersten Typs 
gemaO fur das Quetldatenformat kennzeichnenden Beschreibungsregein (11) automatisch Kennzeichnungen 

30 generierbar und diese zusammen mit zumlndest einem Teil des Quellinhalts in dem Zieldatenlormat als Do- 

kumente (15) zweiten Typs abspeicherbar sind, 

eine Datenbank (5) und eine Extrahiereinheil (4) zum Abspetchern dieser Kennzeichnungen in der Datenbank 
(5). 

- und ein Hypetlextsystem (6. 9) zum Anzeigen des in den Dokumenten ( 1 5) zweiten Typs gespoichenen Quoll- 
3S inhalts. wobei zumlndest ein Teil des Ouellinhalls, lur den Kennzeichnungen generlert wurden, als Hyperlinks 

anzeigbar sind. die Inlormation zur Derelerenzierung der Hyperlinks aus den in der Datenbank (5) abgespel- 
cherton Kennzeichnungen ableitbar sind und zusatzlich Dbor logikbasierte Anfrageelemente automatisch Do- 
kumente (17) eines drilten Typs erzeugbar sind. die Ober das Hyperlexlsysiem anzeigbar sind und Hyperlinks 
enthalten, die aus den in der Datenbank abgespeicherten Kennzeichnungen ableitbar sind. 

40 



4S 



so 



ss 
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